期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于BERT的三阶段式问答模型
彭宇, 李晓瑜, 胡世杰, 刘晓磊, 钱伟中
《计算机应用》唯一官方网站    2022, 42 (1): 64-70.   DOI: 10.11772/j.issn.1001-9081.2021020335
摘要595)   HTML27)    PDF (918KB)(393)    收藏

预训练语言模型的发展极大地推动了机器阅读理解任务的进步。为了充分利用预训练语言模型中的浅层特征,并进一步提升问答模型预测答案的准确性,提出了一种基于BERT的三阶段式问答模型。首先,基于BERT设计了预回答、再回答及答案调整三个阶段;然后,在预回答阶段将BERT嵌入层的输入视作浅层特征来进行答案预生成;接着,在再回答阶段使用经BERT充分编码后的深层特征进行答案再生成;最后,在答案调整阶段结合前两个答案产生最终的预测结果。在抽取式问答任务的英文数据集SQuAD2.0和中文数据集CMRC2018上的实验结果显示,该模型在精准匹配度(EM)和F1分数(F1)两个指标上相较于同类基准模型平均提升了1~3个百分点,抽取出的答案片段更加准确。通过融合BERT中的浅层特征与深层特征,该三阶段模型拓展了BERT的抽象表示能力,探索了BERT中的浅层特征在问答模型中的应用,具有结构简单、预测准确、训练和推断速度快等特点。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于循环神经网络的电信行业容量数据预测方法
丁尹, 桑楠, 李晓瑜, 吴飞舟
计算机应用    2021, 41 (8): 2373-2378.   DOI: 10.11772/j.issn.1001-9081.2020101677
摘要509)      PDF (1094KB)(379)    收藏
在电信运维的容量预测过程中,存在容量指标和部署业务种类繁多的问题。现有研究未考虑指标数据类型的差异,对所有类型的数据使用同种预测方法,使得预测效果参差不齐。为了提升指标预测效率,提出一种指标数据类型分类方法,利用该方法将数据类型分为趋势型、周期型和不规则型。针对其中的周期型数据预测,提出基于双向循环神经网络(BiRNN)的周期型容量指标预测模型,记作BiRNN-BiLSTM-BI。首先,为分析容量数据的周期特征,提出一种忙闲分布分析算法;其次,搭建循环神经网络(RNN)模型,该模型包含一层BiRNN和一层双向长短时记忆网络(BiLSTM);最后,充分利用系统忙闲分布信息,对BiRNN输出的结果进行优化。与传统的三次指数平滑、差分自回归移动平均(ARIMA)模型和反向传播(BP)神经网络模型进行比较的实验结果表明,在统一日志数据集和分布式缓存数据集上,提出的BiRNN-BiLSTM-BI模型的均方误差(MSE)分别比对比模型中表现最优的模型降低了15.16%和45.67%,可见预测准确率得到了很大程度的提升。
参考文献 | 相关文章 | 多维度评价
3. 用于短文本情感分类的多头注意力记忆网络
邓钰, 李晓瑜, 崔建, 刘齐
《计算机应用》唯一官方网站    2021, 41 (11): 3132-3138.   DOI: 10.11772/j.issn.1001-9081.2021010040
摘要550)   HTML34)    PDF (681KB)(377)    收藏

随着社交网络的发展,对其包含的海量文本进行情感分析具有重要的社会价值。不同于普通文本分类,短文本情感分类需要挖掘隐含的情感语义特征,具有极大的难度和挑战性。为了能在更高的层次上得到短文本的情感语义特征,提出了一种多头注意力记忆网络(MAMN)用于短文本情感分类。首先,利用n元语法特征信息和有序神经元长短时记忆(ON-LSTM)网络对多头自注意力机制进行改进,以对文本上下文内联关系进行充分提取,使模型可以获得更丰富的文本特征信息。然后,利用多头注意力机制对多跳记忆网络的结构进行优化,使得在拓展模型深度的同时,挖掘更高层次的上下文内联情感语义关系。在电影评论集(MR)、斯坦福情感树(SST)-1和SST-2这三个不同的数据集上进行了大量实验。实验结果表明,与基于循环神经网络(RNN)和卷积神经网络(CNN)结构的基线模型以及一些最新成果相比,所提MAMN取得了较优的分类效果,验证了多跳结构对于性能改善的重要作用。

图表 | 参考文献 | 相关文章 | 多维度评价
4. 面向电信行业网络告警系统的告警过滤算法
徐冰珂, 周宇喆, 杨茂林, 谢远航, 李晓瑜, 雷航
计算机应用    2018, 38 (10): 2881-2885.   DOI: 10.11772/j.issn.1001-9081.2018040879
摘要712)      PDF (774KB)(398)    收藏
为了减小电信网络中海量告警数据对的告警根源分析所造成的干扰,提出一种告警过滤算法。首先,基于电信网络告警数据对告警量分布、告警持续时间等特征进行量化分析,提出告警影响力和高频瞬态告警概念。在此基础上,从告警量、平均告警时间、告警影响力以及告警实例持续时间四个维度对告警重要程度进行综合分析,并提出复杂度为 On)( n为告警记录数)的告警过滤算法。单因素实验分析显示,告警压缩比与特定告警元的告警量、平均告警时间、告警影响力以及告警实例持续时间具有正相关关系。对比实验结果表明,在相似告警压缩比下,所提算法的准确性比FTD(Flexible Transient flapping Determination)算法最多提高18个百分点,可用于电信行业的告警数据样本分析以及在线告警过滤。
参考文献 | 相关文章 | 多维度评价